#Claude AI | 熱門關鍵字 | 鉅亨號 | Anue鉅亨

#Claude AI

中國AI闖入全球程式設計前二！前面只剩Claude

【新智元導讀】Code Arena最新放榜，Qwen3.7-Max以1541分衝進全球第四，成為前五中唯一的非Claude模型。程式設計，中國模型第一次殺到這個位置。就在今天，Code Arena最新榜單出爐！ Qwen3.7-Max以1541分闖入全球前四，一舉超越了GPT-5.5、Gemini 3.5 Flash等一眾頂尖模型。排在它前面的，只剩Claude Opus 4.7和Opus 4.6。

Fortune雜誌─OpenAI創始成員宣佈轉投Anthropic

Anthropic似乎已勢不可擋。該公司接連發佈了多款重磅模型，據稱其正在洽談的新一輪融資估值接近1兆美元，公司年化收入規模呈現近乎指數級增長。如今，這家公司又將死對頭OpenAI旗下最知名的前成員之一收入麾下。 2018年5月10日，時任特斯拉（Tesla）AI總監的安德烈·卡帕西在一場會議上發表演講。圖片來源：Michael Macor/The San Francisco Chronicle via Getty Images 安德烈·卡帕西周二在社交平台X發帖稱：“個人近況更新：我已經加入Anthropic。”這條帖子發佈僅一小時便獲得近300萬次瀏覽。他表示，未來幾年將是大語言模型前沿發展的“關鍵成型期”，而他也迫切渴望重新回到研究工作。本周起，他已加入Anthropic的預訓練團隊。這一決定意味著，在AI競賽不斷升溫之際，在X平台上擁有近200萬粉絲的AI大V卡帕西已經選擇了自己的陣營。2015年，他是OpenAI創始成員之一；隨後離開OpenAI，前往特斯拉（Tesla）負責AI業務；2023年重返OpenAI，但僅一年後再次離開，創辦了自己的教育科技公司Eureka Labs。

奧特曼親封GPT-5.5「自閉天才」！16人團隊連夜退訂Claude

【新智元導讀】奧特曼親口蓋章，GPT-5.5是個「自閉天才」。16人團隊連夜退訂Claude，換GPT-5.5月省3.2萬刀。Codex單周狂飆9000萬下載大虐對手12倍，開發者大遷徙開始了。剛剛，奧特曼親手給GPT-5.5起了一個讓全網炸鍋的外號——「自閉天才」。他不禁感嘆，真不敢相信，我們居然造出這樣的AI！ GPT-5.5上線半個月，奧特曼在社交平台上，多次毫不掩飾地表達了自己的興奮。

Claude 進了 Office，真正被改寫的是 AI 的權力結構

Anthropic 的 Claude 正式進入 Microsoft 365，這看起來像是一條普通的產品接入新聞，實則是 AI 產業權力結構發生遷移的一個明確訊號。Claude 已經可以直接在 Excel、Word、PowerPoint 中工作，並開始進入 Outlook。這意味著使用者可以在微軟自己的 Office 體系裡，直接呼叫來自 Anthropic 的模型處理文件、郵件、財務模型與演示材料，而不必只依賴微軟自己主推多年的 Copilot。如果只從產品競爭角度看，這件事會顯得矛盾。微軟一邊持續重金押注 OpenAI，把 GPT 深度嵌入自己的生產力套件，一邊卻允許競爭對手進入自己的核心地盤。這看起來像是戰略搖擺，但如果把視角從“模型競爭”提升到“平台控制”，邏輯就完全不同了。真正變化的，不是 Copilot 的地位，而是 AI 產業的權力中心。過去兩年，AI 行業的核心敘事是模型競爭。市場關注的是誰的推理能力更強，誰的上下文窗口更大，誰的程式碼生成更準確。OpenAI、Anthropic、Google 的競爭，本質上是一場能力軍備競賽。但當 Claude 可以進入 Office 時，說明競爭已經進入下一階段：模型本身開始商品化，真正稀缺的資源不再只是模型能力，而是工作流入口。

噓，Claude正在「做夢」！睡一覺瘋狂進化，一夜暴漲6倍戰力

【新智元導讀】Claude開發者大會來了！這一次，Anthropic讓Agent學會了「做夢」，兩次幹活的間隙自動反芻記憶、自我進化。配合多Agent兵團作戰和自動評分官，AI任務完成率直接暴漲6倍。就在剛剛，Anthropic讓AI學會做夢了！ Code with Claude舊金山開發者大會上，Anthropic真的給Claude託管智能體加了一個叫Dreaming的功能—— AI可以在兩次工作的間隙，像人類進入REM睡眠一樣，自動回顧歷史會話、整理碎片記憶、發現隱藏規律。

一年後程式設計師將會逐步消失| Boris（claude code技術負責人）訪談筆記

來源：Lenny's Podcast，2026年2月，約95分鐘一、他自己怎麼用 AI從去年 11 月到現在沒手寫過一行程式碼。每天 10 到 30 個 PR，全是 Claude Code 出的。早上睜眼第一件事：拿手機打開 Claude iOS 的 code tab，把 agent 派出去跑。同時掛著四五個 agent 平行幹活。他在 Instagram 那會兒就是產出最高的幾個工程師之一。不是本來就寫得少。這一點，從去年11月份到現在還手寫程式碼的同學需要反思了（國央企，保密單位啥的沒辦法的不算），國內用不了claude ios app的也要反思了，不過還不晚，從今天起全部借助 agent,多個agent,另外能搞成skill的節能或者能力的都能搞盡快搞。二、他對程式設計的定調"Coding is largely solved." 至少他自己做的那類活，已經解決了。下一步是 agent 不光寫程式碼，還自己提需求。翻 feedback，看 bug report，讀 telemetry，然後跑來跟你說"這幾個可以修""那幾個可以加"。一到兩年後，學一門具體語言沒啥意義了。就跟現在沒幾個人在乎彙編一樣。年底前 "software engineer" 這個詞會開始退場，換成 "builder"。或者乾脆不分了，人人都是 PM 兼碼農。要立即退出程式設計的行列，不要在古法程式設計了，提升效率，程式語言的學習將沒有意義，這一點挺讓人傷心的，但是不能固步自封啊，前進吧。年底前，軟體工程師將會逐步的，徹底退出歷史舞台，這一點其實有點誇張，borris作為全球最頂級程式設計 agent的負責人，說的激進點沒啥問題，不過明年年底前肯定要退出歷史舞台了。三、資料SemiAnalysis 的報告：GitHub 上 4% 的 commit 是 Claude Code 寫的。這還只是公開倉庫，私有的比例更高。年底可能到 20%。增速不是線性的，還在往上翹。Anthropic 內部工程師產出漲了 200%（按 PR 算）。Boris 之前在 Meta 管程式碼質量，幾百號人折騰一年也就提幾個百分點。對比之下這個數很離譜。這一點是程式設計師們心裡最痛的一個點，github啊，全球開放原始碼的集中地，後續將會有90%以上的程式碼都是由AI完成，這很難接受，難接受但是很合理。四、這東西怎麼來的剛加入 Anthropic 的時候花了一個月各種瞎搞原型，大部分沒出貨。又花了一個月做post-training，瞭解模型底層。他習慣搞清楚你踩的那層下面那層是什麼。第一個原型叫 Claude CLI。給模型一個 bash 工具讓它自己玩。他隨口問"我在聽什麼歌"，模型自己就用 bash 翻出來了。他自己都沒想到這問題能答。發內部公告拿了兩個 like。沒人覺得終端裡能長出什麼正經程式設計工具。為什麼是終端？因為開始就他一個人。終端最省事。後來發現這歪打正著——模型迭代太快了，別的介面根本跟不上。終端正好是最"裸"的殼。2025 年 2 月對外發，一開始也不算爆款。好幾個月大家才搞懂怎麼用。Opus 4 之後開始真起飛。大牛也一樣要經歷沒人理睬的時刻，但是依然保持熱情，結果一下就爆了，在整個AI發展事上Borris恐怕會像linus一樣留下美名，雖然有很多安妮紡織機的工人會很反感他，開玩笑，繼續往下看。五、產品哲學1. 潛在需求（Latent Demand）老版本：看使用者拿你產品在幹什麼歪門邪道，然後把它做成正經功能Facebook Marketplace 是這麼來的：40% 的群組帖子其實是買賣東西。Facebook Dating 也是：60% 的 profile 瀏覽是異性非好友。Co-work 更典型：一堆非技術使用者用 Claude Code 種番茄、分析基因組、恢復硬碟照片、看 MRI 片子。那就給他們做個正經產品算了。這就是傳統的軟體開發流程啊，使用者需要什麼，我們就去滿足它。新版本（AI 時代）：看模型自己想幹什麼，順著它的勁兒來。別跟它較勁。2. 別給模型套框一年前可能還需要各種編排器、固定工作流。現在給工具和目標就行，讓它自己找路。Claude Code 從頭就定了"模型即產品"。最少的殼，最少的內建工具，讓模型自己決定用啥、按什麼順序。現在claude code的確是最少的殼，最少的內建工具，用著用著模型會自主決定用那個工具，不帶跟你商量的，其實使用者在用的過程中也不斷的完善自己的一堆skills.3. Bitter Lesson通用模型永遠吃掉專用模型。別在小模型、fine-tune、工作流上花太多力氣，下一版模型出來全給你抹平。他的原話："Build for the model six months from now." 前六個月產品可能很一般，模型一上來直接起飛。如果一開始大家就知道，通用模型會吃掉專用模型，很多的資金就可以節省下來，很多創業的小夥伴就可以好好的了，不得不佩服段永平先生的一個神觀點：敢為人後，AI初期，攻城略地很有意義，但是觀察整個行業，在合適的時候出手沒問題，不要一開始就跑馬入場，很可能成炮灰，但是學習，持續的觀察整個行業動態是必須的，前置的。4. 少給資源人少反倒逼著人用 AI 想辦法。一個人扛一個項目，自然就想快點出貨。AI 給你加速，不需要老闆在後面催。後邊一個老闆帶著一個有編碼經驗的老碼農就行了，這也是碼農的福利了，一個碼農要兼PM,設計以及測試（其實增加一個測試skill就可以了），老闆在市場衝鋒陷陣，後邊一個碼農就是一個產研團隊，給老闆提供充足的支援。5. 反饋飛輪內部有個 channel 全是吐槽。Boris 早期是有人反饋幾分鐘內出 PR。讓人覺得自己說了算，反饋就越來越多，飛輪就轉起來了。現在 Claude 自己替他幹大部分。激情四射的Borris!六、安全：三層底層：mechanistic interpretability（機制可解釋性），直接看神經元在幹嘛，追蹤"欺騙神經元"之類的東西。Chris Olah 是這個領域的開創者。中層：evaluations，實驗室環境的安全評估。上層：丟到真實世界，看它在野外的表現。所以產品發佈經常叫 "research preview"，不是噱頭，是在收真實資料。"Race to the top"：把 sandbox 開源了，任何 agent 都能用。想讓行業在安全上捲起來，別比爛。安全是必須要考慮的，AI時代安全比網際網路時代的安全更隱蔽，而且現在在很初期的階段，，前兩天發生了一起使用者用cursor + optus 4.6刪除使用者生產資料庫造成損失的案例，我別的文章有詳細報導。見AI9秒刪庫事件：程式設計師必學的5條安全教訓七、工程師這個角色的去向Cursor 插曲：2025 年中加入 Cursor，兩周走人。原因簡單——他想念 Anthropic 的使命。Cursor 做的事很酷，但他需要工作綁在一個更大的意義上，不然自己待不住。他學程式設計的起點：中學給圖形計算器寫程序，為了數學考試作弊。後來寫了個通用求解器賣給全班，大家一起被抓。老師沒讓他們畢業。從頭到尾程式設計就是工具，不是目的。也承認有人就是愛手寫。隊裡有工程師周末還手搓 C++，就是享受。"以後還會有空間，就像現在還有人寫鋼筆字。"給學生：學校別光盯著程式碼。去學系統架構、產品、設計、商業。以後最搶手的人不是最會寫程式碼的，是能跨好幾個領域、知道到底該造什麼的人。程式設計師同學們，這是個哲人啊，程式設計永遠是工具，不應該是目的，不能贊同更多。或許，以後網路直播手寫程式碼也會成為一個流量的噱頭。還在學電腦沒畢業的孩子們，要去看看這篇文章的原視訊，看看Borris的更詳細的說明，要學架構、產品、設計、商業。後續的人才必須是跨學科的，應該不是說人才，而是普通的打工人也要是跨領域的，一招鮮，吃遍天的時代徹底終結了。八、印刷術這個類比1450 年代以前，歐洲識字率不到 1%。所有文字活全交給抄寫員（scribes）。古騰堡之後 50 年，產出的印刷品比之前一千年加起來還多。成本降了一百倍。200 年後識字率從 1% 到了 70%。沒有印刷術就沒有文藝復興——沒人識字你傳播什麼。有個歷史文獻挺妙的：當時有抄寫員被問到對印刷術的看法，說很高興終於不用抄書了，可以專心做插畫和裝訂（那些更有意思的活）。Boris 把自己跟這個比：不用再折騰配環境、調依賴、修編譯錯誤那些破事了。時間花在跟使用者聊、想方向、跟團隊碰。長期看：程式設計從少數人的手藝變成人人都有的能力，能釋放出什麼？猜不到，但樂觀。短期看：會疼，會有人被淘汰。這是全社會的事，不該一家公司拍板。古騰堡是西方近代印刷術之父，borris舉這個例子就是說明，碼農終於不用手寫程式碼了，終於可以利用自己的頭腦，借助AI做很多自己喜歡做的事情，但是陣痛是不可避免的，長期來看是正向的，積極的。九、對程式設計師說的實在話用最強模型。Opus 4.6 + maximum effort。便宜模型來回修反而更費 token。八成任務先開 plan mode。原理土到掉渣：就是注入一句"先別寫程式碼"。計畫對味了再讓它跑，4.6 下幾乎一把過。給工程師拉滿 token。單人實驗的 token 費遠低過他的工資。真跑出好東西再最佳化成本。各種介面都試試。terminal、desktop app、手機端，那個順手用那個。這不是個純終端工具。多開幾個 agent 平行跑。別一次只跑一個。別怕，去玩。泡在工具最前沿，這是唯一不掉隊的方式。這段既是在宣傳自己的產品，雖然不用宣傳也知道你是最強的，也是在告訴大家一個道理，最貴的可能是最便宜的，而最便宜的可能才是最貴的。我喜歡這種自信。十、零碎但有意思的他生在烏克蘭奧德薩，主持 Lenny 也是。倆人訪談中途當場認老鄉。爺爺是蘇聯第一批程式設計師，用打孔卡寫程序。他媽小時候拿打孔卡當塗鴉紙。進 Anthropic 之前在日本的鄉下住了好幾年，鎮子上唯一寫程式碼的、唯一說英語的。會做味噌。白味噌三個月起，紅的要兩到四年。說是他練耐心用的，也是 AGI 之後的退休方案。書單：《Functional Programming in Scala》（他說是最好的技術書，雖然你可能不寫Scala 了）、《Accelerando》（Charles Stross，節奏和現在 AI 這波一模一樣）、《流浪地球》短篇集（說中國視角的科幻跟西方完全不同，看著新鮮）。格言：use common sense。別看到流程就跟著跑，別看到大家都在做就覺得對。聞著不對勁，它就是不對勁。就這些，這是一個頂級極客，也是一個有意思的很自信的人，碼字不易，歡迎大家點贊推薦打賞三連，原視訊細節更多，歡迎去看。 (米斯特太陽)

撕開Claude Code真相：讓它好用的98.4%，是工程不是AI

當普通人還在鑽研「最強提示詞咒語」時，矽谷頂級實驗室已經把AI基建跑成了生產線。你還在ChatGPT的聊天框裡反覆調prompt？最近，一位X使用者發了條推文，開頭就是一個驚呼：頭部大廠偷偷在用的Claude Code項目範本外洩！這已經不是寫提示詞了。這是AI工程基礎設施。整套打法圍繞一個檔案「CLAUDE.md」展開，而它的核心原則只有三條：每次Claude犯錯→你加一條規則；每次你重複自己→你加一個工作流；每次出bug→你加一道護欄。這樣做，是要把項目經驗沉澱成它每次啟動都會讀取的長期上下文和自動化約束。整個架構，像是一家AI公司的崗位編制：CLAUDE.md是入職手冊，skills/是工作SOP，hooks/是合規部，docs/是公司章程，tools/是後勤組，src/才是真正出活的業務部門。你不再是在和AI聊天了，而是在建構一個瞭解你程式碼倉庫的AI。最瘋狂的部分是，你只需要配置一次，Claude就會自動審查程式碼，並按指令重構、強制執行架構規則、撰寫發佈說明、從技能中運行工作流、記住過去錯誤等。而且它會越用越聰明。大多數人，都是打開ChatGPT，寫提示詞，複製貼上，反覆；而在這套打法下，你只需要打開終端，跑一個skill程式碼已交付。這等於是在自己的程式碼庫裡養了一隊AI同事。這條推文背後，傳遞的是這個時代正在悄悄翻篇的一個小訊號，大多數人可能還沒反應過來。一張不算洩露的「洩露截圖」撕開一個真相@ai_rohitt曬出來的這張截圖，是Anthropic官方文件裡公開推薦的Claude Code標準範式。CLAUDE.md是Claude Code在每次會話開始時自動讀取的項目記憶檔案。.claude/skills/和.claude/hooks/是官方支援的擴展機制。這些都是社區已經討論了幾個月的公開做法，並不是什麼人偷出來的「內部範本」。但它之所以能讓一些資深開發者主動轉發，說明它得到了一些天天用Claude的開發者們的認同。其中相當一部分人，可能這兩天才意識到原來它還能這麼用。而矽谷頂級團隊，已經把這件事跑成了生產線。第一個例子，是OpenAI Frontier團隊。OpenAI官方披露的Frontier團隊實驗中，一個從空repo起步的內部beta，在約5個月內由Codex生成了約100萬行程式碼和約1500個PR；團隊從3人擴展到7人，人工不直接寫程式碼。帶隊的Ryan Lopopolo在後續訪談中進一步提到，這套工作流已經接近「0 人工程式碼、0 人工 review」的極限形態。他認為與其節省token，不如利用模型極高的並行能力和極低的成本來代替人類有限且昂貴的同步注意力。第二個例子，是Stripe內部的自動化程式碼代理系統Minions。Stripe內部的Minions每周生成並推動超過1300個PR合併，這些程式碼從頭到尾由AI生成，但仍經過人工review。這裡還有一對資料：1.6%vs98.4%，它來自Mohamed bin Zayed AI大學VILA-Lab發表的一篇論文。https://arxiv.org/pdf/2604.14228研究者係統性扒了Claude Code v2.1.88版本51.2萬行TypeScript原始碼，給出的結論是：只有1.6%是AI決策邏輯，剩下的98.4%是確定性的工程基礎設施。具體說就是權限閘道器、上下文管理、工具路由、錯誤恢復這四類。這組數字不是說模型只貢獻1.6%的能力，而是說明Claude Code作為產品，大量複雜度不在模型本身，而在權限、上下文、工具路由、恢復機制等確定性工程基礎設施上。@ai_rohitt那張圖裡的CLAUDE.md/skills/hooks結構，就是普通開發者也能搭一套的「入門版基建」，它和OpenAI、Stripe那套生產級架構是同一種範式，只是規模小得多。CLAUDE.md暴露的秘密過去3年，所有人都在問「GPT什麼時候能更聰明」「Claude什麼時候出新版本」。但真正在生產環境跑通AI程式設計的團隊，他們更關心的可能根本不是這個，而是如何讓AI記住自己上次踩過的坑，怎麼讓AI在動手前先看一眼項目的架構約束，怎麼讓AI犯錯的時候自己被工具擋住。CLAUDE.md正是這一切的承載體。Anthropic官方對它的定義只有一句：一個markdown檔案，放在項目根目錄，Claude Code在每次會話開始時自動讀取。https://code.claude.com/docs/en/memory聽上去很簡單，圍繞它展開的那幾層結構，才是它真正厲害的部分。CLAUDE.md是項目大腦。架構決策、命名約定、測試要求、那些反覆踩過的坑，都堆在這裡。它是AI每次啟動時第一眼看到的「員工手冊」。.claude/skills/是可復用工作流。Claude Code的建立者Boris Cherny在社區裡反覆強調一句話：「如果你每天做某件事超過一次，把它變成skill或command。」一個skill就是一段可執行的方法論。Code review、生成commit message、寫發佈說明，這些都不該是每天手敲提示詞的活，應該是skill調一下就出結果。.claude/hooks/是自動護欄。這是最關鍵的部分。它不依賴AI自己判斷，由確定性程式碼在AI犯錯之前就擋住它。這就是為什麼敢讓AI「無人監督」地跑，因為出錯的邊界由hooks卡死了。docs/decisions/是架構決策記錄。讓AI不僅知道程式碼「是什麼」，還知道程式碼「為什麼是這樣」。這一項最容易被忽略，但也是AI協作最大的槓桿點。tools/和src/是執行層。這套架構真正值得注意的地方，不在於某個開發者搞出了一個漂亮目錄，而是越來越多獨立團隊正在收斂到同一個方向：把模型放進一套由上下文、工具、權限、評估和反饋循環組成的harness裡。GitHub上已經能看到不少類似項目：rohitg00的awesome-claude-code-toolkit、diet103的claude-code-infrastructure-showcase、affaan-m的everything-claude-code，都在圍繞agents、skills、hooks、rules、MCP configs等元件搭建Claude Code的工程化工作環境。這說明，真正成熟的AI程式設計工作流，不是只靠一個更強的模型，也不是只靠一條更長的prompt，而是把模型嵌入一套可復用、可約束、可恢復、可審計的工程系統裡。至於具體目錄結構，各家實現並不完全相同。OpenAI實驗室的極限實驗2026年2月11日，OpenAI官方部落格發了一篇文章：《Harness engineering: leveraging Codex in an agent-first world》。https://openai.com/index/harness-engineering/Anthropic圍繞這個概念重新調整了Claude Code的架構思路；Martin Fowler的網站把它凝練成一個公式：「Agent=Model+Harness。」Harness這個詞來自馬術。它指的是馬的整套挽具，韁繩、馬嚼子、馬鞍、籠頭。一匹馬可以跑得很快很有力，但它自己不知道往那兒走：整套挽具決定了它的方向。類比到AI程式設計：模型本身能力很強，但它不知道在你的程式碼庫裡該往那兒走。Harness就是你為它造的方向盤+剎車+導航。OpenAI Frontier團隊那個「100萬行0人工」的實驗，本質就是把Harness做到極致。他們的關鍵工程實踐包括以下幾條。層級架構強約束。從Types到Config到Repo到Service到Runtime到UI，依賴關係單向流動，由linter在CI層強制執行。Agent寫出違反層級關係的程式碼？直接建構失敗。linter錯誤資訊本身是修復指令，這也是最反直覺的細節。普通項目的lint錯誤是「violation detected」，給人看的；OpenAI Frontier的lint錯誤是「use logger.info({event: 'name', ...data}) instead of console.log」，給Agent看的、可以直接讀懂並修復的指令。文件作為單一事實來源。所有架構圖、execution plans、設計規範都在倉庫內部的docs/目錄。Agent不需要任何外部知識庫，一切就在repo裡。這套東西效果有多厲害？模型沒有換，但LangChain調整了harness，包括系統提示、工具、中介軟體和推理模式，最終把Terminal Bench 2.0分數從52.8提到66.5。你今天就能做的事是為AI造一個項目大腦問題回到普通開發者這裡：如果範式已經轉移，作為一個普通工程師，今天就能做點什麼。第一件事，在你最重要的項目根目錄建一個CLAUDE.md。不需要完美，也不需要很長。寫下你團隊的架構規則、命名約定、測試要求、那些反覆踩過的坑，10分鐘能寫完一個能用的版本。下次AI犯錯的時候，先不要手動修，而是問自己一句：CLAUDE.md裡缺了什麼？第二件事，把每天重複做的事改造成skill。這裡要注意Boris Cherny的金句：「如果你每天做某件事超過一次，把它變成skill或command。」Code review、生成commit message、寫發佈說明、修一類重複的bug，這些都該是skill，不該是每天手敲提示詞。第三件事，在容易踩坑的地方加一個hook。Hook是98.4%裡最有槓桿的那部分。它不依賴AI變聰明，它依賴確定性程式碼做強制檢查。這是把人類工程師的判斷力翻譯成機器可讀約束的過程。這件事的核心不在寫程式碼，而在寫規則。Karpathy今年1月在推特上的那句被廣泛轉發的話：「我已經從80%手動寫程式碼變成了80%交給Agent寫。」未來五年，工程師的能力曲線正在從「我能寫多少行程式碼」轉向「我能為AI設計多嚴格的工作環境」。寫程式碼的活兒正在被Agent接管。但設計那個讓Agent能寫出好程式碼的世界，還是人的工作。而且比以前更難、更重要、也更有意思。 (新智元)

Anthropic估值突破1兆，Claude Opus 4.7剛剛改變了AI競爭格局

如果說2025年的AI競爭還是"OpenAI vs Google"的雙雄會，那2026年第一季度，這個格局被徹底改寫——Anthropic這個以安全研究起家的公司，在短短三個月內完成了從追趕者到定義者的轉變。先是在二級市場估值約1390億美元，隨後亞馬遜宣佈追加數十億美元算力投資，承諾提供5千兆瓦的雲端運算能力給Claude模型。而最新發佈的Claude Opus 4.7和爆發式增長的Claude Code，正在改變開發者對AI編碼工具的認知。【一、兆估值背後的三重敘事】Anthropic的估值飆升並非偶然，它背後是三條清晰的增長邏輯。▸ 資本敘事：從去年底的約600億美元估值，到2026年4月突破1390億美元，Anthropic只用了不到四個月。推動力來自兩筆關鍵交易——亞馬遜的40億美元追加投資，以及二級市場的機構搶籌。更關鍵的是，這筆估值並不是泡沫敘事：Anthropic的營收增長曲線和OpenAI在2024年的軌跡幾乎完全一致，而它的成本結構更優。▸ 產品敘事：Claude Opus 4.7的發佈是轉折點。與前代相比，它在多模態推理、程式碼生成精度和長上下文理解三個維度上實現了質的飛躍。內部測試顯示，Opus 4.7在複雜程式碼審查任務上的精準率超過了人類資深工程師的中位數。這不再是"接近GPT-4"的故事——在某些維度上，它已經領跑了。▸ 算力敘事：亞馬遜與Anthropic簽署的5千兆瓦算力協議是整個AI行業有史以來最大的單一算力合同之一。這相當於多個核電站的總輸出功率，用來訓練和推理下一代Claude模型。配合Anthropic自研的晶片合作計畫，這意味著Anthropic的算力儲備可能在未來18個月內超越OpenAI。【二、Claude Opus 4.7——到底強在那裡】Claude Opus 4.7的發佈在某些圈子裡引起的不是讚譽，而是恐懼——因為它真的能替代一些高級工程師的工作了。▸ 程式碼能力：在SWE-bench（軟體工程基準測試）上，Opus 4.7得分超過了85%，這意味著它能夠獨立完成大部分真實世界的編碼任務，包括程式碼審查、debug、重構。更可怕的是，它不只是能寫程式碼——它理解程式碼架構。給一個複雜的微服務項目，它能讀懂全貌，定位根因，給出重構方案。這種"架構級理解"能力是目前其他模型不具備的。▸ 多模態推理：Opus 4.7不僅能看懂圖，還能在圖表、流程圖、UML、技術白皮書之間進行跨模態推理。給它一張系統架構圖，它能讀懂每一個元件的關係，指出潛在的單點故障。給它一份論文圖表，它能結合全文內容解釋趨勢背後的原因。▸ 長上下文：Opus 4.7的200K token上下文窗口這次是實打實的。在長文件理解測試中，它能在200頁的技術文件中精準找到特定資訊並給出推理鏈。這對律師、研究員、合規分析師來說，是革命性的——相當於每個分析師都有一個能讀完整年資料的助理。▸ 與國產模型的對比：值得單獨拿出來說的是，就在Opus 4.7發佈後沒幾天，DeepSeek在4月24日發佈了DeepSeek V4——1.6兆參數MoE架構（49B活躍參數），1M token上下文窗口，API定價僅為Opus 4.7的十分之一。具體資料上看：在SWE-bench Verified上，V4-Pro拿到80.6%，與Opus 4.6僅差0.2分；LiveCodeBench上V4-Pro更是以93.5%排名第一。開啟Max推理模式後，V4-Pro-Max在編碼和推理任務上已逼近Opus 4.7的水平。這是國產模型第一次在發佈節點和性能水平上同時追平美國頂級閉源模型。但Opus 4.7的架構級程式碼理解能力——即在不給定具體bug的情況下，主動發現並評估整個項目的技術債務——在國產模型中仍然沒有對等產品。【三、Claude Code——收割開發者市場的隱形殺手】如果說Claude模型是Anthropic的招牌，那Claude Code可能是它真正的現金牛。Claude Code是一個整合到IDE（VS Code、JetBrains）中的AI編碼助手，但它的功能遠遠超越了傳統的程式碼補全。它能獨立管理整個程式碼庫——包括建立分支、提交程式碼、運行測試、修復bug、重構模組。開發者只需要用自然語言描述任務，Claude Code就能自主完成。▸ 增長資料：Claude Code的使用者量在Opus 4.7發佈後的一個月內增長了300%以上。Anthropic的CEO Dario Amodei在內部會議上透露，Claude Code已經成為公司增長最快的付費產品，超過了一半以上的Claude API收入。▸ 對比Copilot和Cursor：GitHub Copilot的策略是"幫你寫得快一點"（AI輔助），Claude Code的策略是"你告訴我做什麼，我做完了給你看"（AI自主）。這是兩種完全不同的哲學。Cursor走的是中間路線，但它依賴的底層模型也在快速迭代。Claude Code的壁壘在於——它和Opus 4.7是深度繫結的，Anthropic在模型層直接做了針對性最佳化，這是第三方工具做不到的。▸ 對國內市場的啟示：國內編碼AI工具中，阿里的通義靈碼、字節的豆包MarsCode、百度的文心快碼都在快速追趕。但它們面臨一個結構性問題——底層模型的編碼能力與Claude Opus 4.7有代差。DeepSeek V4這次在agentic coding上下了重注——SWE-bench Verified 80.6%、LiveCodeBench 93.5%的編碼成績已接近Opus 4.7，而且發佈時就宣稱與Claude Code、OpenCode等工具深度整合。如果國產模型繼續以V4的節奏迭代，這個差距可能在未來6-12個月內縮小。【四、亞馬遜的算力賭注——5千兆瓦意味著什麼】最後落到最實際的問題——算力。亞馬遜和Anthropic的5千兆瓦（GW）算力協議，可能是整個AI行業今年最被低估的新聞。▸ 5GW是什麼概念？足夠給約400萬個美國家庭供電。一個典型的核反應堆輸出約1GW。這意味著Anthropic將擁有5個核電站等級的專屬算力。作為對比，OpenAI在微軟Azure上拿到的算力承諾大約是2-3GW等級。▸ 這筆算力將用來做什麼？主要用來訓練Claude Opus 5和後續模型，以及支撐Claude API的推理需求。Anthropic的安全研究傳統意味著他們在訓練時會做比同行更多的紅隊測試和安全驗證——這需要大量額外的算力。▸ 對國產AI的影響：字節跳動的豆包、百度的ERNIE、深度求索的DeepSeek同樣在快速擴建算力基礎設施。DeepSeek V4通過混合注意力架構（Hybrid Attention Architecture）和MoE設計實現了極高的訓練效率——在1M token長上下文場景下僅需V3時代27%的推理FLOPs。不過，在絕對算力規模上，國產公司與美國頭部AI公司仍有數量級差距。好消息是，華為昇騰晶片的成熟度在快速提升，國產AI晶片生態正在縮小與輝達的距離。【五、超越OpenAI的可行性——Anthropic的三大風險】討論Anthropic的崛起，不能只講利多。這個兆估值能站住嗎？要看三大風險。▸ 第一，營收能否支撐估值？Anthropic目前年化營收約數十億美元規模，而兆估值對應的市銷率超過30倍。這需要Claude API的付費使用者在未來18個月內增長3-5倍——而OpenAI、Google、DeepSeek V4也在以極低價格瘋狂搶客。DeepSeek V4的定價（Pro版$1.74/$3.48每百萬token，Flash版僅$0.14/$0.28）是整個行業的"價格錨"，Claude必須用產品力抵消這個價差。▸ 第二，Claude Code的護城河有多深？程式碼助手市場有GitHub Copilot（微軟）、Cursor、Amazon CodeWhisperer等對手。如果微軟把Copilot深度整合到VS Code和GitHub的每個角落，Claude Code的使用者增長可能會遇到天花板。▸ 第三，安全研究公司的悖論——越安全越難商業化。Anthropic以AI安全研究起家，這個基因既是它的品牌溢價，也是它的天花板。在"跑得快"和"跑得安全"之間做權衡時，Anthropic往往會選擇後者。在技術快速迭代的窗口期，這可能是致命的——DeepSeek V4在4月24日從預覽直上正式版就是一個反面案例，它證明了"先發佈+快速迭代"策略的有效性。Anthropic的偏執安全路線能在多大程度上轉化為競爭壁壘，而不是自我設限，還有待驗證。結語：Anthropic的故事告訴我們：在AI這個賽道上，市場格局遠未固定。三個月前還沒人把它當對手，三個月後它估值破兆。有趣的是，就在同一天（4月24日），DeepSeek V4和Claude Opus 4.7幾乎同時定義了中美AI的新坐標系——一個靠價格和開放，一個靠產品和護城河。Claude Opus 4.7和Claude Code不是終點——它們是Anthropic全面進攻的起點。而這場戰爭的下一個變數，可能來自中國的DeepSeek、字節跳動，也可能來自一個還沒有名字的實驗室。 (超前觀察)